home *** CD-ROM | disk | FTP | other *** search
/ MacFormat 1994 August / August CD.bin / Shareware / Education / MacPattern 3.2 / MacPattern Manual / MacPattern Manual.rsrc / TEXT_152.txt < prev    next >
Encoding:
Text File  |  1993-12-07  |  2.1 KB  |  57 lines

  1. Appendix B: PROSITE Pattern Syntax
  2.  
  3.  
  4. The following is extracted from the PROSITE User Manual Rel. 5:
  5.  
  6. {quote start}
  7. -  The standard IUPAC one-letter codes for the amino acids are used.
  8.  
  9. -  The symbol 'x' is used for a position where any amino acid is accepted.
  10.  
  11. -  Ambiguities are indicated by listing the acceptable amino acids for a
  12.    given position, between square parentheses '[  ]'. For example: [ALT]
  13.    stands for Ala or Leu or Thr.
  14.  
  15. -  Ambiguities are also indicated by listing between a pair of curly
  16.    brackets '{  }' the amino acids that are not accepted at a given
  17.    position. For example: {AM} stands for any amino acid except Ala
  18.    and Met.
  19.  
  20. -  Each element in a pattern is separated from its neighbor by a '-'.
  21.  
  22. -  Repetition of an element of the pattern can be indicated by following
  23.    that element with a numerical value or a numerical range between
  24.    parenthesis. Examples:  x(3) corresponds  to x-x-x and [FY](1,2)
  25.    corresponds to [FY] or [FY]-[FY].
  26.  
  27. -  When a pattern is restricted to either the N- or C-terminal of a
  28.     sequence, that pattern either starts with a '<' symbol or ends with a
  29.     '>' symbol.
  30.  
  31. -  A period ends the pattern.
  32.  
  33. Examples:
  34.  
  35. PA   [AC]-x-V-x(4)-{ED}.
  36.  
  37. This pattern can be translated as: [Ala or Cys]-any-Val-any-any-any-any-{any but Glu or Asp}
  38.  
  39. PA   <A-x-[ST](2)-x(0,1)-V.
  40.  
  41. This pattern, which must be in the N-terminal of the sequence (`<'), can be translated as: Ala-any-[Ser or Thr]-[Ser or Thr]-(any or none)-Val
  42. {quote end}
  43.  
  44. The index generating software in the MacPattern package checks the input pattern database for any syntax errors.
  45.  
  46. Note: if you enter a pattern by keyboard, the following rules apply in addition to the ones above:
  47.  
  48. - You may omit the trailing period.
  49.  
  50. - You may omit the dashes.
  51.  
  52. - Characters can be upper or lower case.
  53.  
  54. - The maximum pattern size is 50 positions. A position is defined by surrounding 
  55.    dashes, whether they are actually used or not. Therefore, a pattern such as 
  56.    M(1,30)-x-K(38,39) [or M(1,30)XK(38,39)] is perfectly fine, since it consists of 
  57.    only three positions, although the matching sequence may be up to 70 residues long.